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摘 要 [目的 /意义 ] 构建 论文 参考 文献 学 科 多 样 性 测度 指标 ， 探 究 论 文 参考 文献 学 科 多 样 性 
与 被 引 频 次 之 间 的 关系 。 [方法 /过 程 ] 基于 Rao-Stirling 多 样 性 指数 设计 参考 文献 学 科 多 样 性 
测度 指标 ， 并 以 论文 参考 文献 学 科 多 样 性 为 自 变量 ,论文 被 引 频次 为 因 变量 ， 期 刊 等 级 等 15 
个 变量 为 控制 变量 , 使 用 普通 最 小 二 乘法 拟 合生 成 回归 模型 , 探讨 论文 参考 文献 学 科 多 样 性 
与 被 引 频次 之 间 的 关系 。[ 结 果 / 结 论 ] 研究 构建 的 参考 文献 多 样 性 测度 指标 能 够 反映 论文 的 
多 学 科 知 识 融 合 程度 ; 论文 参考 文献 学 科 多 样 性 正 向 影响 论文 被 引 频 次 , 论文 参考 文献 学 科 
多 样 性 越 强 ， 论 文 被 引 频 次 越 高 。 
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被 引 频 次 是 论文 受 学 界 关 注 程度 和 论文 自身 学 术 影响 力 的 直观 体现 , 其 在 一 
定 程度 上 能 够 反映 论文 质量 与 学 术 价值 02。 基 于 论文 被 引 频 次 的 相关 评价 指标 
己 成 为 当前 各 机 构 开 展 科研 绩效 评价 和 科研 人 员 职 位 置 升 的 主要 依据 , 如 h 指数 
等 。 明 确 论文 被 引 频 次 的 作用 规律 、 影 响 因素 有 利于 为 科学 管理 工作 提供 参考 ， 
同时 也 能 够 进一步 明确 科研 成 果 的 传播 机 制 。 现 有 研究 探讨 了 作者 学 术 经 验 C A. 
合作 模式 申 、 论 文 来 源 地 理 位 置 钻 、 标 题 形式 I1、 论 文 长 度 同 以 及 是 否 开放 获取 外 
等 因素 与 论文 被 引 频 次 之 间 的 影响 关系 , 但 对 论文 参考 文献 与 被 引 频 次 之 间 关 系 
的 研究 依旧 留 有 探索 空间 。 

参考 文献 是 论文 的 知识 基础 ， 从 论文 知识 生产 过 程 来 看 , 科学 知识 生产 具有 
关联 性 和 累积 性 , 知识 基础 与 论文 产 出 内 容 属 于 同一 体系 ,几乎 所 有 知识 都 是 相 
关 科 研 主体 在 已 建构 的 知识 基础 上 进行 的 延伸 0% 时， 知识 基础 直接 作用 于 论文 
内 容 并 进一步 对 其 后 续 传 播 产 生 影响 。 以 参考 文献 为 代表 的 知识 基础 能 够 充分 体 
现 论文 研究 起 点 以 及 研究 者 前 期 工作 深度 ， 是 反映 与 影响 论文 质量 的 重要 方面 
53。 从 理论 上 说 ,来自 多 学 科 的 参考 文献 可 促进 融合 不 同 领域 知识 ,激发 新 的 
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研究 思路 ， 也 会 吸引 来 自 更 多 学 科 的 引用 外， 能 够 提高 论文 可 见 度 与 影响 力 。 基 
于 现 有 研究 对 论文 参考 文献 学 科 多 样 性 与 被 引 频 次 之 间 关 系 探讨 不 足 的 研究 现 
TR. 本 文 在 构建 指标 测度 论文 参考 文献 学 科 多 样 性 的 基础 上 , 采用 回归 分 析 的 方 
法 研究 论文 参考 文献 学 科 多 样 性 与 被 引 频 次 之 间 的 影响 关系 , 以 期 能 够 为 把 握 论 
文 引用 规律 、 为 相关 管理 部 门 制定 科技 发 展 政策 提供 一 定 参考 。 


1 研究 方法 与 研究 设计 / Research Methodology and Research Design 
1.1 参考 文献 学 科 多 样 性 测度 方法 

参考 文献 学 科 多 样 性 体现 了 论文 知识 基础 的 学 科 交 叉 程 度 , 学 科 多 样 性 强调 
学 科 之 间 的 异 质 性 ， 因 此 在 测度 参考 文献 学 科 多 样 性 时 ， 不 仅 要 数学 科 数 量 ， 也 
要 对 参考 文献 来 源 学 科 之 间 的 差异 度 进行 衡量 。 学 科 多 样 性 测度 的 前 提 是 选取 合 
适 的 学 科 分 类 体系 ， 本 文 以 在 学 界 认可 度 较 高 的 Wos 学 科 分 类 体系 映射 参考 文 
献 的 来 源 学 科 。 在 多 样 性 测度 指标 上 ,目前 学 界 已 有 信息 CShannon Entropy), 
布 里 渊 指数 CBrillouin's Index)、 辛 普 森 多 样 性 指数 (Simpson Index) 等 多 种 测度 
指标 , 但 上 述 指标 大 多 从 1 个 或 2 个 维度 衡量 且 计 算 复 杂 ， 尚 未 形成 系统 化 的 量 
MIRRI MAIWP, Stirling 基于 构建 的 涵盖 丰富 度 、 差 异 度 及 均衡 度 的 多 
样 性 测度 指数 能 够 充分 反映 系统 要 素 分 布 的 多 样 性 特征 ， 相 较 其 他 指标 在 综合 
性 方面 表现 出 极 大 优势 7711, 现 已 获得 学 界 的 广泛 认可 与 应 用 0M, 因此 本 文 使 
用 该 指数 计算 论文 参考 文献 学 科 多 样 性 ,依据 该 指数 ， 本 文 构建 的 参考 文献 学 科 
多 样 性 测度 指数 包含 三 个 基本 维度 ， 如 图 1 所 示 。 


图 1 学 科 多 样 性 测度 维度 


Figure 1 Dimensions of the disciplinary diversity measure 


在 本 文中 ，Variety 指 参考 文献 来 源 学 科 数 量 ，Balance 指 参考 文献 来 源 学 科 
分 布 的 均衡 性 ，Disparity 指 参考 文献 来 源 学 科 之 间 的 差异 性 。 参 考 文献 所 属 学 科 
数量 越 多 、 分 布 越 均衡 、 差 异 越 大 ， 则 其 学 科 多 样 性 越 强 。 参 考 已 有 研究 中 ， 本 
文 设计 如 下 规则 计算 学 科 差异 性 : 

| 1， 不 同学 科大 类 
Dj = 


0.66， 同 一 大 类 不 同学 科 (1) 
0， 同 一 学 科 


Dij 指 参考 文献 学 科 差 异性 , 各 参考 文献 来 源 于 不 同学 科大 类 ,如 SCI 和 SSCI, 
则 认为 其 多 学 科 性 最 强 ， 学 科 差 异 赋 值 为 1; 知 来 源 于 同一 学 科大 类 下 的 不 同学 
科 ， 学 科 差 异 赋 值 为 0.66; 若 来 源 于 同一 学 科 ， 学 科 差 异 赋 值 为 0。 综 合 以 上 ， 
参考 文献 学 科 多 样 性 指数 的 计算 见 公式 2。 


公式 2 中 ，PDI 为 参考 文献 的 学 科 多 样 性 ，Vi 为 学 科 数 量 ，Bj 为 学 科 分 布 均 


衡 性 ，Di 为 学 科 差异 性 。 
1.2 变量 选取 与 测度 
1.2.1 自 变 量 与 因 变量 

本 研究 的 自 变量 为 论文 参考 文献 学 科 多 样 性 , 以 上 述 构建 的 学 科 多 样 性 测度 
站 标 测度 。 因 变量 为 论文 被 引 频 次 ， 以 论文 自发 表 至 2024 年 1 月 的 5 年 累计 被 
引 频次 表示 。 
1.2.2 控制 变量 

(OD 参考 文献 数量 。 参 考 文献 数量 能 够 反映 研究 者 对 相关 领域 的 了 解 程度 
和 对 专业 知识 的 运用 情况 03， 是 判断 论文 知识 吸收 与 利用 能 力 P1 和 论文 总 体质 
量 的 重要 参考 指标 3, 已 有 研究 表明 ,其 能 够 对 论文 被 引 频 次 产生 影响 ,因此 
将 参考 文献 数量 作为 控制 变量 , 具体 以 原始 数据 中 的 Cited Reference Count 表示 。 

OD 参考 文献 创新 性 。 研 究 表 明 ， 具 有 更 前 沿 的 理论 与 技术 的 知识 基础 更 
容易 激发 具有 创新 性 的 知识 生长 点 8 针 ， 因 而 参考 文献 创新 性 也 直接 体现 论文 新 
颖 度 卢 “94， 从 而 会 对 论文 的 被 引 频 次 产生 影响 。 衡 量 参考 文献 创新 性 时 ， 为 避免 
极 值 等 异常 情况 对 测度 结果 的 影响 , 本 文 以 单 篇 论文 所 有 参考 文献 创新 性 的 中 值 
表示 论文 参考 文献 整体 创新 性 1。 


(3) 论文 创新 性 

研究 表明 ， 科 研 论文 创新 性 是 影响 论文 被 引 频次 的 关键 因素 P， 本 文 使 用 
Wu 等 基于 施 引 文献 结构 设计 的 D 指数 测度 论文 创新 性 请), 并 将 其 作为 控制 变量 
纳入 回归 模型 。 该 指数 的 计算 方法 见 公式 3。 


D-pi 


See 35 


PE 
公式 3 中 ，i 表示 只 引用 被 测 论文 ，j 表示 既 引 用 被 测 论文 又 引用 其 参考 文 
献 , k 表示 仅 引 用 被 测 论文 参考 文献 。D 的 取 值 范围 为 [-1,1]，D=1 说 明 论 文 实 现 
了 突破 式 创新 ，D=0 说 明 论 文 为 中 性 突破 性 ，D=-1 说 明 论 文 未 实现 突破 ， 是 对 
己 有 研究 的 巩固 1。 
为 便于 进行 回归 分 析 与 结果 比较 , 本 文 将 计算 得 到 的 创新 性 值 儿 进行 有 量 纲 
的 归 一 化 处 理 ， 使 原始 数据 落 在 区 间 [0,1] 中 ， 计 算 方法 见 公 式 4。 


Nan secum. (4) 
23d Xmax-Xmin 


公式 4 中 ，xnew 为 归 一 化 值 ，x 为 原始 数值 ，xmin 和 xmax 分 别 为 原始 数值 中 
的 最 小 值 和 最 大 值 。 

(4) 期 刊 等 级 分 数 。 通 常 而 言 ， 论 文 发 表 期 刊 等 级 越 高 ， 论 文 越 有 可 能 获 
得 更 多 的 关注 。 对 于 期 刊 等 级 分 数 ，, 参考 已 有 研究 路， 本 文 依据 期 刊 分 区 对 其 进 
行 分 级 赋 分 ， 赋 分 规则 见 公式 5。 其 中 $j 为 期 刊 等 级 分 数 ， 最 高 为 10 分， 最低 为 
2 分 ， 若 论文 来 源 于 QI 区 期 刊 ， 则 期 刊 等 级 赋予 最 高 分 10 分 ， 若 来 源 于 其 他 期 
刊 则 赋值 为 2 分 。 


10, Q1 
8, Q2 
Sj=4 6, Q3 (5) 
4, Q4 
2， 其 他 
(5) 其 他 控制 变量 。 除 上 述 变量 外 ， 参 考 学 界 研 究 ， 本 文 将 作者 数 、 基 金 
数 、 标 题 长 度 等 会 也 会 对 论文 被 引 频次 产生 影响 的 变量 作为 控制 变量 同时 纳入 回 
归 模 型 ， 各 变量 及 其 描述 见 表 1。 


表 1 变量 描述 

Table 1 Description of variables 
变量 分 类 | 变量 名 称 变量 描述 
因 变 量 PC5 论文 5 年 累积 被 引 频次 
自 变量 PDI 参考 文献 学 科 多 样 性 
PD 论文 创新 性 
CD 参考 文献 创新 性 
参考 文献 数量 


学 科 数 

TL 标题 长 度 

控制 变量 KN 关键 词 数 

AL 摘要 长 度 

PN 页 数 

QS 期 刊 等 级 分 数 

OA 是 否 OA 发 表 

是 否 为 作者 独 著 论 文 

IS 是 否 为 机 构 独 著 论 文 
为 国家 独 


虚拟 变量 


[um 


2 实证 分 析 /Empirical analysis 
2.1 数据 采集 与 处 理 
本 文 所 用 数据 来 源 于 Computer Science，Artificial Intelligence、Engineering， 

Biomedical 和 Genetics & Heredity 领域 ， 原 因 在 于 学 科 交 叉 融 合 往往 被 视 为 创新 
成 果 产 出 的 动力 之 源 B1, 而 上 述 领域 易 产 生 突 破 性 成 果 , 其 参考 文献 可 能 具有 典 
HEAR SUE, 因此 选取 上 述 领域 进行 研究 具有 一 定 代表 性 。 由 于 本 文中 对 论文 及 参 
考 文献 创新 性 指数 的 计算 时 间 为 2022 年 6， 该 指数 的 计算 依赖 论文 施 引 结构 ， 
而 通常 论文 的 引用 在 其 发 表 2 年 后 能 够 在 领域 内 达到 较为 稳定 的 状态 , 为 保证 论 
文 及 参考 文献 创新 性 测度 结果 的 稳定 性 S33， 本 文选 取 2019 年 的 论文 作为 实证 样 
Z. RAME, Æ Wos 核心 合集 中 按照 领域 检索 的 方式 进行 检索 ， 将 文献 类 型 
限定 为 ARTICLE 和 PROCEEDINGS PAPER， 最 终 得 到 论文 157,831 篇 ， 提 取 的 


数据 项 包括 Article Title, Authors, Source Title. Affiliations. Cited References, 
Times Cited 等 。 

本 文 使 用 DOI 号 匹配 论文 D 指数 并 衡量 论文 创新 性 63， 因 此 ， 首 先 删除 原 
台 论 文中 无 DOI 号 、 参 考 文献 与 施 引 文献 数量 为 0 以 及 无 突破 性 分 数 的 论文 ， 


剩余 论文 110,205 篇 。 其 次 ， 对 参考 文献 数据 进行 清洗 与 处 理 ， 提 取 所 有 参考 文 
献 的 DOIL 号 与 来 源 期 刊 ， 构 建 < 论文 -参考 文献 DOI 号 ”数据 集 、“ 论 文 -参考 文献 
来 源 期 刊 ”数据 集 , 随后 综合 利用 JCR 和 ESI 期 刊 列表 中 的 21,576 本 期 刊 信息 构 
建 参 考 文献 来 源 期 刊 及 其 所 属 学 科 间 的 映射 关系 B4。 借鉴 已 有 研究 Po0, 对 于 学 科 
标识 为 “Multiple” 的 期 刊 ,， 本文 取 第 一 学 科 作为 期 刊 所 属 学 科 , 最 终 构建 < 论文 - 参 
考 文献 所 属 学 科 ” 数 据 集 。 由 于 参考 文献 存在 “No title captured” 以 及 无 DOI 号 等 
数据 缺失 情况 ,为 保证 研究 结果 的 可 靠 性 , 本文 计 算 了 参考 文献 创新 性 指数 及 学 
科 与 原始 参考 文献 数 的 实际 匹配 率 , 以 二 者 匹配 率 同 时 达到 90% 及 以 上 的 12,949 
篇 论文 作为 最 终 样本 ， 其 中 包含 参考 文献 611,880 篇 。 
2.2 总 体 结果 描述 性 分 析 

首先 ， 本 文 对 论文 被 引 频次 的 整体 分 布 情况 进行 了 分 析 ， 分 析 结 果 见 图 2。 
图 中 横 坐 标 为 论文 被 引 频 次 区 间 , 纵 坐 标 为 论文 落 在 特定 区 间 中 的 概率 , 高 度 越 
Hp, 表明 总 体 样本 中 落 在 该 区 间 的 数据 点 越 多 。 由 图 2 可 见 , 样本 论文 被 引 频 次 
落 在 区 间 [1,201] 中 的 概率 最 大 ， 也 就 是 说 论文 被 引 频次 集中 分 布 在 该 区 间 。 


被 引 频次 区 间 


图 2 论文 被 引 频次 分 布 
Figure 2 Distribution of citation frequency 
其 次 ,本 文 对 论文 参考 文献 学 科 多 样 性 的 得 分 分 布 情况 进行 了 分 析 ， 分 析 结 
果 见 图 3， 图 3 中 ， 横 坐标 为 参考 文献 学 科 多 样 性 得 分 区 间 ， 纵 坐标 为 分 布 于 特 


定 区 间 中 的 论文 数量 。 由 图 可 见 ， 论 文 参考 文献 学 科 多 样 性 集中 分 布 于 区 间 
《0.35,0.4] 和 区 间 《〈0.4，0.45] 中 ， 分 布 于 区 间 〈0.4，0.45] 中 的 论文 数量 最 多 ， 共 
有 6578 篇 , 占 样 本 论文 的 50.799% .分布 于 参考 文献 学 科 多 样 性 最 强 的 区 间 (0.45， 
0.5] 中 的 论文 有 1128 篇 ， 占 样本 论文 的 8.711%。 
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参考 文献 学 科 多 样 性 

图 3 参考 文献 学 科 多 样 性 分 布 情况 
Figure 3 Distribution of disciplinary diversity of references 

2.3 参考 文献 学 科 多 样 性 与 被 引 频 次 的 关系 分 析 
2.3.1 变量 统计 特征 
由 表 2 可 见 ， 论 文 参考 文献 学 科 多 样 性 最 大 值 为 0.467， 最 小 值 为 0， 中 位 
数 为 0.410; 论文 被 引 频 次 的 最 大 值 为 2317， 最 小 值 为 1， 方差 为 2227.385， 数 
据 呈 离散 分 布 特点 。 为 增加 数据 稳定 性 , 本 文 对 因 变 量 作 LOG10 对 数 转 换 处 理 
使 其 满足 正 态 分 布 要 求 以 便 进 行 回归 分 析 。 对 数 转 换 后 的 因 变 量 分 布 见 图 4， 由 


因 变 量 分 布 P-P 图 可 见 ， 因 变量 已 呈现 正 态 分 布 特征 。 
表 2 变量 描述 性 统计 


Table 2 Descriptive statistics of variables 


` 


N | 最 小 值 | 最 大 值 | 平均 值 | 中 位 数 EX | 方差 

PC5 1 2317 24.52 14 | 47.195 | 2227.385 
PD 0 0.630 0.368 | 0.368 | 0.006 0 
CD 0.182 | 0.325 0.778 | 0228 | 0.002 0 
PDI 0 0.476 0.394 | 0.410 | 0.065 | 0.004 
CR d 1 292 47.25 44 | 25.482 | 649318 
AN 1 468 8.69 7 14.542 | 211.474 
FN 0 133 2.92 2 3.352 | 11.238 
PCN 1 7 1.99 2 0.960 | 0.921 


TL 3 36 14.11 14 4.196 17.606 
KN 0 37 4.15 5 2.478 6.139 
AL 0 594 215.21 209 67.089 | 4500.983 
PN 2 47 11.50 11 4.925 24.251 
QS 2 10 7.88 8 2.297 5.213 
OA 0 1 0.63 1 0.483 0.233 
AS 0 1 0.01 0 0.103 0.011 
IS 0 1 0.14 0 0.349 0.122 
CS 0 1 0.68 1 0.468 0.219 
10 
08 
5 0.6 
累 
» 
02 
0.0 
0.0 02 04 0.6 08 10 
实测 累积 概率 


图 4 因 变 量 正 态 分 布 检验 图 


Figure 4 Plot of dependent variable normal distribution test 


2.3.2 变量 相关 性 
本 文 使 用 Spearman 相关 系数 检验 变量 相关 性 。 由 表 3 可 见 ， 参 考 文献 学 科 
多 样 性 与 论文 被 引 频次 呈 显 著 正 相关 关系 。 控 制 变量 中 ， 除 论文 标题 长 度 外 ， 其 
他 变量 缘 通 过 了 显著 性 检验 。 除 此 之 外 ,相关 性 结果 表明 自 变 量 及 控制 变量 间 的 
相关 系数 均 低 于 0.7， 说 明 变 量 之 间 不 存在 强 相关 关系 ， 且 变量 间 的 容忍 度 
(Tolerance) 均 远 大 于 0.1， 方 差 膨胀 因子 均 小 于 10， 说 明 模 型 不 存在 多 重 共 线 
性 问题 ， 可 以 进行 回归 分 析 。 


表 3 变量 相关 改 


m 


Table 3 Variable correlations 


PCS PDI PD CD RN AN FN PCN TL KN AL PN QS AS IS CS OA 
PCS Ez 
PDI .136*** -- 
PD -344*** 161*** -- 
CD -.062*** QgT*** E vil lai 
RN 357*** .303*** .035*** .043*** -- 
AN .205*** .054*** -.074*** -.048*** 075**** -- 
FN .263*** .109*** -.059**** -0.014 .265*** :3921*** -- 
PCN .086*** .107*** .025** 0.012 .038*** -.050*** -.030*** -- 
TL -0.007 0.006 .046*** .053*** Osee opp -0.014 -0.009 -- 
KN -0527244 .109*** .075*** .109*** .099*** -.118*** -.083*^** -.064**** .086*** -- 
AL .072*** .095*** .030*** .018* .234*** .103*** O3 peter .040*** .194*** A 12*** -- 
PN .338*** .185*** .020* .029*** .678*** .100*** 252 .033*** 07 pee .060*** DAFFA -- 
QS ,515*** .189*** -.116*** -.035*** .387*** .226*** :323 0k dq35 00 0.006 -.106*** A2175 .380*** -- 
AS -.063*** -.056*** .023** 0.001 -.050*** -.180*** -.094**** -.020* -.052*** -0.007 -.084*** -.039*** -.068*** -- 
IS -.097*** -.048*** .042*** .041*** -.07pev* -28lp*** -.149**** 0.005 -0.006 .020* -.065**** -.059*** -.129**** ,133'8** -- 
CS -.124*** 0.008 .090*** .082*** -.119*** -267*** -208*** .020* 0.010 .021* -.040**** RO -.148*** .053*** .258*** -- 
OA .100*** SST -.021* 0.001 179*** .144*** .169*** -.128*** 0.002 -0.013 .134*** .175*** .195*** -.036*** -.086**** -.130*** -- 
T 0.838 0.978 0.952 0.577 0.884 0.825 0.935 0.958 0.921 0.836 0.557 0.738 0.966 0.904 0.875 0.906 
VIF 1.193 1.022 1.051 1.733 1.132 1.212 1.07 1.044 1.086 1.197 1.797 1:355 1.035 1.107 1.143 1.104 
EEDJE. kk E 


E 0.001 2&3, THX 


.在 0.001 级 别 ， 相 关 性 显著 ; *. 在 0.05 级 别 ， 相 关 性 显著 ; T 表 示 容 忍 度 ，VIF 表示 方差 膨胀 因子 。 


2.4 模型 构建 与 拟 合 


2.4.1 模型 构建 


本 文采 用 多 元 线 
次 之 间 的 关系 ， 将 所 有 变 划 


生 回 归 分 析 法 分 析 论 文 参考 文献 学 科 多 样 性 与 论文 被 引 频 
量 纳入 回归 函数 建立 的 多 元 线性 回归 模型 见 公式 6: 


logio(PCs)=Bo+BiPDI+ BzPD+ B3CD+ BsRN+ BsAN+ BeFN+ p;PCN- 


BeTL+ BoKN+ BioAL+ 
模型 中 ，Bo 是 截 距 项 


差 项 。 


BuiPN+ B12QS+ B13AS + BisIS+ BieCS+ Bi7OA+H (6) 


，Bi 至 B17z 是 自 变 量 、 控 制 变量 对 应 的 回归 系数 ,为 残 


2.4.2 回归 模型 拟 合 与 结果 分 析 


与 其 他 方法 求 得 的 无 偏 估计 量 相 比 ， 最 小 二 
OLS) 收敛 速度 快 ， 拟 合 


此 ,本 文 使 用 最 小 二 


乘法 拟 合 回归 模型 。 


乘法 (Ordinary Least Squares, 


效果 好 ， 具 有 估计 量 无 偏 性 和 最 小 方差 性 的 优势 93]， 
为 直观 体现 论文 参考 文献 学 科 多 样 性 对 


被 引 频 次 的 影响 ， 本 文采 用 逐步 回归 分 析 法 ， 在 模型 1 中 只 加 入 控制 变量 ,模型 
2 在 模型 1 的 基础 上 加 入 参考 文献 学 科 多 样 性 ， 以 此 衡量 参考 文献 学 科 多 样 性 对 


论文 被 引 频 次 的 影响 ， 回 归结 果 见 表 4。 


Lu 


程度 为 32.496. 


回归 结果 可 见 , 模型 1 的 R?=0.324, 说 明 控 制 变量 


量 对 论文 被 引 频 次 的 解释 


在 所 有 控制 变量 中 ， 


是 否 机 构 独 著 (IS， 和 是 否 国家 独 著 (CS) 


未 通过 显著 性 检验 ， 作 者 数 、 基 金 数 、 学 科 数 、 论 文 页 数 、 期 刊 等 级 和 参考 文献 


数量 正 向 影响 论文 被 引 频 次 ， 
效果 优 于 模型 1, 
文 被 引 频次 ， 表 明 论 文 参考 文献 学 科 多 样 


0.325， 拟 合 


其 他 变量 负 向 影响 论文 被 引 频 次 。 模 型 2 的 R 为 
参考 文献 学 科 多 样 性 在 0.001 级 别 显著 正 向 影响 论 


性 是 影响 论文 被 引 频 次 的 因素 之 一 。 
表 4 模型 拟 合 结果 


Table 4 Regression results of model fitting 


模型 1 模型 2 

变量 标准 化 系数 标准 化 系数 

AN 0.100*** (0.0000 | 0.101*** (0.000) 
FN 0.069*** (0.001) | 0.067*** (0.001) 
PCN 0.017* (0.004) 0.015* (0.004) 
TL -0.021** (0.001) — | -0.021** (0.001) 
KN -0.028*** (0.001) | -0.029*** (0.001) 
AL -0.022** (0.0000 | -0.023** (0.000) 
PN 0.055*** (0.001) | 0.056*** (0.001) 


0.429*** (0.002) 


0.424*** (0.002) 


AS -0.022*** (0.033) -0.021** (0.033) 
IS -0.011 (0.010) -0.010 (0.010) 
CS -0.010 (0.008) -0.011 (0.008) 
OA -0.031*** (0.007) | -0.031*** (0.007) 
CD -0.051*** (1.403) | -0.057*** (1.424) 
RN 0.128*** (0.000) 0.121*** (0.000) 
PD -0.056*** (0.556) | -0.059**** (0.558) 
PDI 0.032**** (0.056) 
N 12949 12949 

显著 性 0.000 0.000 

R2 0.324 0.325 

调整 后 R? | 0.323 0.324 


*** 在 0.001 级 别 相 关 性 显著 ; 


2.5 模型 稳健 性 检验 


** (E 0.01 级 别 相关 性 显著 ; 


米 A 


E 0.05 ZEE XEM 


显著 ;括号 内 为 标准 误 。 


参考 已 有 研究 84, 本 文采 用 抽取 子 样本 的 方式 检验 模型 稳健 性 。 为 排除 结果 
的 随机 性 ， 使 用 RAND 函数 多 次 抽取 其 中 5000 篇 论文 作为 样本 数据 进行 检验 ， 


结果 表明 模型 R? 并 无 显著 变化 , 表 5 为 随机 抽样 数据 的 回归 结果 。 上 


HÆ 5 可 见 ， 


回归 模型 整体 丝 显 关 ， 参 考 文献 学 科 多 样 性 对 被 引 频 次 的 影响 关系 并 没有 改变 ， 


表明 本 文 构建 的 模型 较为 稳定 


Lo 


de 5 模型 稳健 性 检验 
Table 5 Model robustness test 


= re 共 线 性 统计 
变量 标准 化 系数 m3 [ VIF 
AN 0.123*** (0.000) 0.856 | 1.168 
EN 0.059*** (0.002) 0.814 | 1.228 
PCN 0.022 (0.006) 0.935 | 1.069 
TL -0.037** (0.001) 0.956 | 1.046 
KN -0.019 (0.002) 0.914 | 1.095 
AL -0.008 (0.000) 0.838 | 1.194 
PN 0.053*** (0.001) 0.535 | 1.869 
QS 0.425*** (0.003) 0.736 | 1.359 
AS -0.031** (0.053) 0.957 | 1.045 
IS -0.020 (0.016) 0.900 | 1.111 
CS -0.007 (0.012) 0.881 | 1.135 
OA -0.024 (0.012) 0.915 | 1.093 
CD -0.065*** (2.412) 0.896 | 1.116 
RN 0.101*** (0.000) 0.551 | 1.814 
PD -0.051**** (0.703) 0.890 | 1.123 
PDI 0.042*** (0.093) 0.839 | 1.192 
N 5000 


显著 性 0.000 
R? 0.331 
调整 后 R? | 0.329 
***. 在 0.001 级 别 相 关 性 显著 ;**. 在 0.01 级 别 相关 性 显著 ;*. 在 0.05 级 别 相关 性 显著 ; 括号 内 为 标准 误 。 


3 研究 结果 讨论 与 展望 / Discussion of findings and outlook 

本 文 设计 论文 参考 文献 学 科 多 样 性 测度 指标 , 依据 测度 结果 对 论文 参考 文献 
学 科 多 样 性 与 被 引 频 次 之 间 的 关系 进行 了 研究 。 经 相关 性 分 析 、 总 体 结果 分 析 以 
及 回归 结果 分 析 ， 本文 发 现 , 论文 发 表 期 刊 等 级 是 影响 论文 被 引 频 次 最 核心 的 因 
Ro 其 与 被 引 频 次 之 间 明 显著 正 相 关 关 系 ， 论 文 发 表 期 刊 等 级 越 高 ,论文 获得 的 
被 引 次 数 就 越 高 。 除 期 刊 等 级 外 ， 相 较 其 他 控制 变量 ， 论 文 作 者 数量 和 论文 参考 
文献 数量 对 被 引 频 次 的 影响 最 为 显著。 

本 文 进一步 通过 逐步 回归 分 析 方 法 , 对 参考 文献 学 科 多 样 性 和 论文 被 引 频 次 
之 间 的 影响 关系 进行 了 分 析 , 研究 结果 表明 参考 文献 学 科 多 样 性 显著 正 向 影响 论 
文 被 引 频 次 , 加 入 参考 文献 学 科 多 样 性 的 回归 模型 拟 合 优 度 优 于 仅 包 含 控 制 变量 
的 模型 拟 合 优 度 , 表明 论文 参考 文献 学 科 多 样 性 越 强 , 论文 越 有 可 能 吸引 更 多 的 
引用 。 进一步 表明 融合 多 学 科 交 叉 的 知识 、 思 维 、 资 源 等 的 知识 基础 为 论文 创造 
了 更 为 广泛 的 创新 思想 来 源 , 在 一 定 程度 上 能 够 促进 论文 产 出 价值 的 提升 R71, 进 
而 对 论文 后 向 引文 影响 力 产生 影响 。 

综 上 ,本 研究 对 揭示 论文 影响 力 的 影响 因素 而 言 具 有 一 定 参考 价值 ,不 足 之 
处 在 于 当前 研究 仅 以 3 个 领域 数据 为 样本 进行 分 析 ， 同 时 ， 由 于 数据 获取 难度 较 
K, 暂 未 将 作者 研究 领域 特征 纳入 控制 变量 中 进行 分 析 , 未 来 将 进一步 扩充 实证 
样本 量 , 利用 数 智 技术 获取 更 多 对 论文 参考 文献 学 科 多 样 性 与 被 引 频 次 之 间 影 响 
关系 产生 作用 的 变量 数据 ， 从 更 加 全 面 、 综 合 、 深 入 的 视角 探索 论文 参考 文献 学 
科 多 样 性 与 被 引 频 次 之 间 的 关系 。 


TTT 
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Abstract: [Purpose/Significance] The paper constructs the index of the discipline diversity 
of the paper reference, and explores the relationship between the discipline diversity of the paper 
reference and the citations. [Method/Process| The reference discipline diversity measurement 
index was designed based on the Rao-Stirling diversity index, and 15 variables including the 
reference discipline diversity of the paper were taken as the independent variable, the citation of the 
paper as the dependent variable, and the journal rank as the control variable. The regression model 
was generated by fitting the ordinary least square method. This paper discusses the relationship 
between the subject diversity ofthe paper references and the citation frequency. [Result/Conclusion] 
The index of reference diversity constructed by this research can reflect the degree of 
multidisciplinary knowledge integration of the paper. The diversity of the reference disciplines 
positively affects the citation frequency of the paper. The stronger the diversity of the reference 
disciplines, the higher the citation of the paper. 
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